假设检验
概念
- 第一类错误(拒真)
- 第二类错误(存伪)
- 当H0为假时接受的概率为β
- 当H0为假时拒绝的概率为检验的势,等于1−β
- 当原假设为真时, 检验统计量的分布为零分布
- 简单假设
- 在所有构造的统计量中,基于似然比的统计量有最大的势
- 要求H0和HA都是简单假设
- 在同样的检验水平下
- uniformly most powerful
- 若HA是复杂的,H1相对于HA中的每一个假设都是最优的,则H0是一致最优的
公式
- 设ω0 为原假设的参数集合,ω1是备择假设的参数集合,Ω=ω0∪ω1,则−2logA的零分步服从自由度为dimΩ−dimω0的卡方分布
- 例子
- 多项分布的似然比检验
- posisson散度检验
- 由于Ei都一样,因此可以写成 T=xˉnσ2
- 其统计量都一样(自由度不一样):
- −2logA=2∑Oilog(EiOi)=∑Ei(Oi−Ei)2
plot
悬挂根图
用估计的概率得到拟合值:nj^=npj^
可以发现,pj^较大的值含有较大的方差:var(nj−nj^)=npj
需要进行方差稳定性变换:
varY=σ2(μ)[f′(μ)]2
因此,一般取nj−nj^
悬挂卡方图
nj^nj−nj^
数据汇总
概念
- 经验累计分布函数Fn(x)
- 期望:E(Fn(x))=F(x)
- 方差:n1F(x)(1−F(x))
生存函数
- Sn(t)=1−Fn(t)
危险函数
- h(t)=1−F(t)f(t)=−dtdlogS(t)
- 核密度估计
- 假设正太分布,则可以构造wh=h1w(hx)
- 则概率密度函数f 的估计为:fh(x)=n1∑wh(x−Xi)
- 中位数
- 样本中位数可以作为总体分位数的估计。构造一个中位数的置信区间:
- (X(k),Xn−k−1)
- 可以计算这个区间的覆盖概率为:P(X(k)≤η≤X(n−k+1))=1−2P(η≤X(k))
- 由于是否大于中位数都是1/2的概率,因此可使用二项分布:2n1j=0∑k−1Cnj=P(Y≤k−1)
截尾均值
- 按照顺序排列数据,丢掉最小的100α%和最大的100α%,计算剩余数据的算术平均
M估计
- min∑Φ(σXi−u)
散度度量
- 最普通的度量为样本标准差S2
- 若观测时来自正太分布的样本,则:σ2(n−1)s2∼χn−12
- 但样本标准差对离群观测比较敏感
- 四分位差(IQR)(25%与75%分位数的差值)
- 中位数绝对偏差(∣xi−x^∣的中位数)(MAD)
可以将其转为正太分布的σ 估计:
- 1.35IQR=0.675MAD=σ
- 皮尔逊相关系数
- r=σ(X)σ(Y)cov(X,Y)=∑(xi−xˉ)2∑(yi−yˉ)2∑(xi−xˉ)(yi−y)ˉ)
- 注意,这个系数只能衡量线性关系
两样本比较
两独立样本比较
基于正态的方法
需要假设X/Y都服从正态分布且方差相等,这里只是检验其均值是否有差异
Xˉ−Yˉ∼N(μx−μy,σ2(n1+m1))
- 若σ已知,则可以构造μx−μy 的置信区间:
- (Xˉ−Yˉ)±z(α/2)σn1+m1
- 更一般的,σ未知时,
- 计算合并样本方差:sp2=m+n−2(n−1)sx2+(m−1)xy2
- 构造t 统计量(自由度为m+n−2 ):t=spn1+m1(Xˉ−Yˉ)−(μx−μy)
- 记Xˉ−Yˉ的估计标准差为:sXˉ−Yˉ=spn1+m1
- 此时,构造μx−μy 的置信区间:
- (Xˉ−Yˉ)±t(α/2)sXˉ−Yˉ
- 可以证明,这种t检验与基于似然比的检验等价
势
势是拒绝假的概率,可以用来确定样本容量的大小
若设备则假设为μX−μY=Δ,则对于原假设μX=μy的拒绝域为:
∣Xˉ−Yˉ∣>z(α/2)σn2
对备则假设进行标准化后,可以得到落入拒绝域的概率为:
1−Θ[z(α/2)−σΔ2n]+Θ[−z(α/2)−σΔ2n]
非参数检验(Mann-Whitney Test)
问题
用x1…xn和y1...ym 表示处理1和处理2的观测值,要比较X和Y的分布是否相同
原假设是完全随机(没有效应),当控制组观测的秩和太大或太小时,拒绝原假设。
操作流程:
- 若有m+n 个实验单元,随机分成实验组和控制组
- 计算控制组的秩,并根据秩和进行判断
在原假设成立下,我们可以计算控制组秩和的统计量为:
- E(TY)=mμ=2m(m+n+1)
- Var(TY)=mσ2(N−1N−m)=12mn(m+n+1)(不放回的抽样)
同时,可以计算X<Y的个数的统计量UY=TY−2m(m+1):
- E(UY)=2mn
- Var(UY)=12mn(m+n+1)
在m和n大于10的时候可以用正态近似,否则需要查表
配对样本比较
基于正态的方法
在方差已知的情况下:
E(Dˉ)=μX−μY
Var(Dˉ)=n1σX2+σY2−2ρσXσY
更一般的,在方差未知的情况下,用样本方差代替总体方差,可得到统计量为:
t=sDˉDˉ−μD∼t(n−1)
其中,sDˉ为样本差的样本方差,即sX−Y/n
符号秩检验
若两个配对样本没有差别,那么可以预计一般的D是正的,一般的D是负的
计算步骤:
- 计算差D,差的绝对值
- 将差的符号用在秩上,得到符号秩
- 计算具有正的符号的秩W+
若W+ 太大或太小,则拒绝原假设
若样本容量超过20,可以用正态近似: